告别解码器饥饿!中国科学院NeurIPS推SpaceServe,高并发克星
在中国科学院计算技术研究所入选NeurIPS 2025的新论文中,提出了SpaceServe的突破性架构,首次将LLM推理中的P/D分离扩展至多模态场景,通过EPD三阶解耦与「空分复用」,系统性地解决了MLLM推理中的行头阻塞难题。
解码器 spaceserve 中国科学院neurips 解码 2025-10-13 08:57 3
在中国科学院计算技术研究所入选NeurIPS 2025的新论文中,提出了SpaceServe的突破性架构,首次将LLM推理中的P/D分离扩展至多模态场景,通过EPD三阶解耦与「空分复用」,系统性地解决了MLLM推理中的行头阻塞难题。
解码器 spaceserve 中国科学院neurips 解码 2025-10-13 08:57 3